AIBase
首页
AI资讯
AI产品库
GEO平台
MCP服务
模型算力广场
ZH

AI资讯

查看更多

Mini-Omni:开启"边思考边说话"新时代的多模态AI模型

Mini-Omni是一款开源多模态大型语言模型,通过集成先进AI技术,实现了实时语音输入输出与"边思考边说话"功能,提供自然交互体验。其核心优势在于端到端实时语音处理,无需额外配置ASR或TTS模型,支持文本等多种模态输入与转换,实现无缝交互。Mini-Omni的独特之处在于其"Any Model Can Talk"功能,允许其他AI模型集成实时语音能力,扩展应用范围。在性能上,Mini-Omni表现出色,支持多种复杂任务,如语音识别、生成、推理等。技术实现融合了Qwen2、litGPT、whisper、snac等模型与工具,提供便捷的本地安装与交互式演示方式,支持AI技术的普及与创新。

19.8k 2 天前
Mini-Omni:开启"边思考边说话"新时代的多模态AI模型

模型

查看更多

kimi-thinking-preview

Moonshot

kimi-thinking-preview

$200

输入tokens/百万

$200

输出tokens/百万

131

上下文长度

MCP

查看更多
mcp-server-whisper

Mcp Server Whisper

MCP Server Whisper是一个基于OpenAI Whisper和GPT-4o模型的音频处理服务器,提供高级音频转录、格式转换、批量处理和文本转语音等功能,通过Model Context Protocol标准实现与AI助手的无缝交互。

python
10.7k
2.0分
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图